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摘要 :【 目 的] 测定 和 分 析 骚 扰 阿 蛟 Armigeres subalbatus 线粒体 全 基因 组 序列 ,并 在 线粒体 基因 组 水 
PIRIT SU, Armigeres 在 库 蚊 亚 科 (Culicinae) 中 的 系统 发 育 地 位 。【 方 法 】 经 PCR 扩 增 和 序列 测 
A ,首次 得 到 骚扰 阿 驱 线粒体 基因 组 序列 ;对 其 核 音 酸 组 成 和 结构 特点 进行 分 析 ; 基 于 蛋白 质 编码 
基因 核 痊 酸 序列 ,采用 最 大 似 然 法 (ML) 和 贝 叶 斯 法 (BI) 构建 库 蚊 亚 科 8 个 种 的 系统 发 育 关 系 。 
【 结果] 骚扰 阿 蛟 线粒体 基因 组 全 长 14 891 bp(GenBank 登录 号 : KY978578) ,包含 37 个 基因 ,其 中 
含 13 个 蛋白 质 编码 基因 、22 个 tRNA 基因 和 2 个 TRNA 基因 ,各 基因 位 置 、 排 列 顺序 与 蚊 科 已 知 物 
种 的 一 致 ;基因 组 碱 基 组 成 具有 明显 的 偏好 性 ,全 基因 组 AT-skew 为 正 值 ,GC-skew 为 负 值 ;13 个 蛋 
白质 编码 基因 的 起 始 密码 子 除 CO1 使 用 TCG 外 ,其 余 均 为 ATN ,终止 密码 子 除 COIT 使 用 不 完全 的 
了 外 ,其 余 均 为 TAA;22 个 tRNA 基因 中 除 rRNA" 99 缺失 DHU 辟 , 其 余 均 可 形成 典型 的 三 叶 草 式 
二 级 结构 。 基 于 库 蚊 亚 科 8 个 种 的 线粒体 基因 组 系统 发 育 关 系 为 库 蚊 属 Culex + (T Armigeres 
348. Aedes), [2538] 2 VE PESCE E 88 REA A RARA A RRI, PLUS Armigeres 与 伊 
KÆ Aedes 亲缘 关系 较 其 与 库 蚊 属 Culex 更 近 , 这 与 传统 的 形态 分 类 学 结果 相 吻 合 。 

关键 词 : PREF; TRA; BRT; 线粒体 基因 组 ; 系统 发 育 
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Sequencing and analysis of the complete mitochondrial genome of 


Armigeres subalbatus (Diptera: Culicidae) 

LI Xu-Dong, CHEN Bin" ( Chongqing Key Laboratory of Vector Insects, Chongqing Key Laboratory of 
Animal Biology, Institute of Insect and Molecular Biology, Chongqing Normal University, Chongqing 
401331, China) 

Abstract: [ ^im] To sequence and analyze the complete mitochondrial genome of Armigeres subalbatus , 
and to explore the phylogenetic position of Armigeres in Culicinae based on mitochondrial genome 
sequences. [Methods] The nucleotide sequence of the mitochondrial genome of Ar. subalbatus was 
determined by using PCR amplification and DNA sequencing. The general features and base composition 
of Ar. subalbatus mitochondrial genome were analyzed, and the phylogenetic relationship of Ar. 
subalbatus with seven other species of Culicinae was constructed by using maximum likelihood method 
(ML) and Bayesian inference ( BI) based on the nucleotide sequences of concatenated protein-coding 
genes (PCGs). [Results] The complete mitogenome of Ar. subalbatus is 14 891 bp in length ( GenBank 
accession no. : KY978578) , and contains 37 genes, including 13 PCGs, 22 tRNAs and 2 rRNAs. Its 
gene organization is consistent with those of the known mitogenomes of Culicidae. The mitogenome has a 


clear bias in nucleotide composition with a positive AT-skew and a negative GC-skew. All 13 PCGs use 
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the ATN as the initiation codon except COI with TCG, and TAA as the termination codon except COI 


with the incomplete T. All tRNAs could form the typical cloverleaf structure except tRN 


Ser (AGN 
AST OON whose 


DHU-arm is lacking. The phylogenetic relationship of eight species within Culicinae based on the 


mitochondrial genomes presents as Culex + ( Armigeres + Aedes). 


[ Conclusion] The phylogenetic 


relationship of Culicinae constructed based on the mitochondrial genomes shows that Armigeres is closer 


related to Aedes than to Culex, which is consistent with the result of the traditional morphology-based 


taxonomy. 


Key words: Culicinae; Armigeres; Armigeres subalbatus; mitochondrial genome; phylogeny 


根据 内 共生 理论 ,动物 体内 的 线粒体 的 祖先 为 
一 种 好 氧 性 的 a 变形 菌 ,其 被 真 核 生 物 吞 噬 后 ,经 
过 漫长 的 共生 过 程 逐步 演化 为 真 核 生 物体 内 线粒体 
( Behura et al., 2011) 。 作 为 一 种 半 自 主 性 细胞 需 ， 
其 基因 组 能 够 在 核 基 因 控 制 下 自主 复制 , 且 具 有 母 
系 遗 传 . 进 化 速率 快 、 种 间 多 态 性 大 及 易于 PCR 扩 
增 等 特点 ( 魏 书 军 和 陈 学 新 ，2011; Cameron, 
2014) ,已 经 在 分 子 进化 分 析 、 种 群 遗传 结构 分 析 、 
系统 发 生 学 分 析 等 方面 得 到 广泛 应 用 ( Brown et al., 
1979; Ballard and Whitlock, 2004) 。 不 同 物种 线 粒 
体 基因 组 大 小 不 一 ,但 对 于 大 部 分 昆虫 而 言 ,其 线 粒 
体 基因 组 长 度 约 为 13 ~ 19 kb 左右 ,含有 37 个 基 
,包括 13 个 蛋白 质 编 码 基 因 (PCGs) ,2 个 核糖 体 
RNA 基因 (rRNA) ,22 个 转运 RNA 基因 (tRNAs) 和 
一 个 长 的 非 编码 区 (又 称 为 控制 区 或 AT 富 含 区 ) 
(Boore，1999 ) 。 

蚊 科 昆虫 与 人 类 关系 密切 ,能 够 传播 症 疾 、 寨 

*、 黄 热 病 和 登革热 等 。 据 世界 卫生 组 织 报道 ,2015 
年 全 世界 有 429 000 人 死 于 症 疾 (其 中 约 303 000 人 
为 5 岁 以 下 儿童 ) (World Health Organization, 
2016) 。 控 制 以 上 传染 病 的 关键 在 于 控制 它们 的 传 
播 媒 介 ( 蚊虫 ) ,这 依赖 于 对 蚊虫 的 生物 学 .遗传 学 
及 基因 组 学 的 相关 基础 性 研究 。 阿 蚊 属 Armigeres 
蚊虫 的 系统 发 育 关 系 尚 不 清晰 ,线粒体 基因 作为 分 
子 标记 广泛 应 用 于 分 子 鉴定 、 系 统 发 生 学 及 种 群 遗 
传 学 研究 (Wei et al., 2010; Zhao et al., 2010; Kim 
et al., 2011) ,因此 对 于 阿 蚊 属 蚊虫 线粒体 基因 组 的 
研究 也 显得 非常 重要 。 

DEEP Armigeres subalbatus 在 分 类 学 上 隶属 
于 蚊 科 库 蚊 亚 科 ( Culicinae ) 阿 蚊 属 (Harbach， 
2007) 。 骚 扰 阿 蚊 为 阿 蚊 属 中 的 优势 种 ,主要 分 布 
于 东洋 区 与 古 北 区 ,在 我 国 除 东北 、 新 疆 及 内 蒙古 等 
高 纬度 地 区 外 均 有 分 布 (李旭东 等 , 2013) 。 成 虫 吸 
血 节 狐 , 人 和 畜 血 兼 吸 , 且 能 传播 班 氏 丝 虫 病 , 是 阿 
蚊 属 中 最 主要 的 骚扰 性 吸血 蚊 种 (Tanaka et al., 













































































1979) 。 本 研究 首次 测 得 驭 扰 阿 蚊 线 粒 体 全 基因 组 
序列 ,并 在 线粒体 基因 组 水 平 对 其 系统 发 生 关系 进 
行 探讨 ,结合 已 发 表 的 库 疏 科 7 种 线粒体 基因 组 序 
列 分 析 了 各 种 属 之 间 的 系统 发 育 关系 ,为 后 续 进 一 
步 在 线粒体 基因 组 水 平分 析 蚊 科 各 种 属 间 的 系统 发 
育 关系 提供 基础 。 














1 材料 与 方法 


1.1 样本 及 其 DNA 提取 

骚扰 阿 蚊 样本 采集 于 云南 省 动 腊 县 的 野外 畜 
舍 。 单 头 蚊 虫 样本 经 乙酸 乙 酯 毒 瓶 处 死 后 ,100% W 
精 浸泡 密封 保存 于 -80% 条 件 下 。 取 其 头 胸部 为 实 
验 材料 ,使 用 SDS/ 和 蛋白 酶 K 裂解 法 提取 总 DNA CAE 
依 霖 等 , 2015) 。 

PCR 扩 增 与 序列 测定 :本 研究 中 的 PCR 引物 采 
用 已 公布 的 双 翅 目 昆 虫 线 粒 体 基因 组 扩 增 通用 引物 
GKI OE, 2013) 。 实 验 采 用 25 pL 反应 体系 : 模 
板 DNA 2 pL, 上、 下游 引物 (10 pmol/L) 4 1 pL, 
dNTP Mix 3 uL, 10 x PCR Buffer ( mg’ * free) 2. 5 
pL, MgCl, (25 mol/L) 1.5 uL, Taq DNA 聚合 酶 
(5 U/uL)0.2 uL, ddH,O 13. 8 uL, PCR 扩 增 程 
序 :94% 预 变性 1 min; 94% 变性 40 s, 48 ~ 55%C GR 
火 45 s, 68% 延伸 1 min, 35 个 循环 ;72C 延伸 10 
min。 扩 增产 物 经 1% 琼脂 糖 凝 胶 电 泳 检 测 后 ,委托 
深圳 华 大 基因 双向 测序 。 
1.2 序列 拼接 及 注释 分 析 

测序 所 得 DNA 片段 使 用 DNAMAN (http: // 
www. lynnon. com/ ) 进行 序列 组 装 拼接 。tRNA 基因 
的 查找 定位 及 其 二 级 结构 的 预测 使 用 在 线 版 的 
tRNAscan-SE Search Server v. 1. 21 (http : // lowelab. 
ucsc. edu/tRNAscan-SE/) ( Lowe and Eddy, 1997), 
其 中 2 个 tRNA 基因 (tRNASer and tRNAArg ) 无 法 在 
线 识 别 ,通过 与 已 知 蚊 种 的 线粒体 基因 组 进行 同 源 
比 对 识别 定位 。13 个 蛋白 质 编码 基因 及 2 个 rRNA 
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基因 利用 Clustal X( Thompson et al., 1997) 与 已 知 
蚊 种 的 线粒体 基因 进行 同 源 比 对 定位 。 利 用 Mega 
5.0 分 别 计算 骚扰 阿 蚊 线粒体 基因 组 中 各 编码 基因 
的 碱 基 组 成 密码 子 使 用 频率 、AT-skew 和 GC-skew 
( Tamura et al., 2011) , 
1.3. 系统 发 育 分 析 

利用 新 测 得 的 骚扰 阿 蚊 线 粒 体 基 因 组 的 蛋白 质 
编码 基因 氨基 酸 , 选 取 GenBank 中 已 报道 的 7 种 库 
蚊 亚 科 蚊 虫 的 线粒体 基因 组 中 13 个 蛋白 质 编 码 基 
的 核 背 酸 序列 ,以 冈比亚 按 蚊 Anopheles gambiae 
为 外 群 ,采用 最 大 似 然 法 (maximum likelihood, ML) 
和 采用 贝 叶 斯 法 ( Bayesian inference, BI) 分 别 构建 
系统 发 育 树 。 利 用 Clustal X( Larkin et al., 2007 ) X} 
核 背 酸 序列 进行 比 对 后 ,用 Modeltest 3.7 软件 计算 
得 出 建树 的 最 适 核 苷 酸 蔡 代 模型 为 GTR +I +G, 
以 MEGA 5.0 重复 计算 1 000 次 ,构建 ML 系统 发 育 
树 及 算得 检验 各 分 支 节点 的 bootstrap 置信 值 。 运 行 
MrBayes 3.1.2 软件 计算 1 x 10* 代 , 每 运行 计算 100 
代 取 样 保存 ,计算 得 到 的 前 2.5 千代 进化 树 合 弃 , 以 
构建 BI 系统 发 育 树 。 

















2 结果 


2.1 骚扰 阿 蚊 线粒体 基因 组 结构 

骚扰 阿 蚊 线粒体 基因 组 全 长 14 891 bp (不 含 
AT 区 ) ( GenBank 登录 号 : KY978578 ) 。 包 含有 37 
个 基因 (13 个 蛋白 质 编码 基因 22 个 tRNA 基因 和 2 
个 rRNA 基因 )。 基 因 序 列 与 已 报道 的 其 他 蚊 种 相 
似 度 高 (Beard et al., 1993; Hua et al., 2016) , 22 
个 基因 (9 个 蛋白 质 编码 基因 和 13 个 tRNA 基因 ) 位 


骚扰 阿 蚊 


Armigeres subalbatus 





图 1 骚扰 阿 蚊 线 粒 体 基 因 组 结构 图 
Fig. 1 Structure of Armigeres subalbatus mitochondrial genome 
图 中 彩色 填充 框 表示 tRNA 编码 基因 ,未 填充 的 白色 框 表 示 蛋 白质 
编码 基因 和 rRNA 基因 ,灰色 为 未 能 测序 的 控制 区 。 用 黑色 和 红色 
字体 标记 的 蛋白 编码 基因 RNA 基因 及 控制 区 分 别 位 于 J 链 和 
链 上 。The color-filled blocks indicate tRNAs, while the unfilled white 



































blocks denote protein-coding genes and rRNA gene and grey blocks 
indicate unsequenced control regions. The protein-coding genes, rRNA 
gene and control regions with black name are located on majority strand , 


whereas those with red names are on minority strand. 


GC-skew 为 负 值 ( — 0. 20) ,表明 整个 基因 组 更 偏好 
于 使 用 A 碱 基 和 C 碱 基 。 从 不 同 的 基因 来 看 ,tRNA 
基因 和 rRNA 的 AT-skew 为 正 值 ,表明 其 偏好 A 碱 
基 , 其 余 基 因 则 偏向 于 使 用 T 碱 基 ; 和 蛋白 质 编码 基 
因 J 链 蛋白 质 编码 基因 及 其 第 2 和 3 位 密码 子 N 
链 蛋白 质 编码 基因 的 第 3 位 密码 子 以 及 rRNA 基因 
的 GC-skew 为 负 值 ,表明 其 偏好 使 用 C 碱 基 , 其余 
基因 GC-skew 为 正 值 ,更 偏好 使 用 G 碱 基 。 





于 J 链 上 ,其 余 15 个 基因 (4 个 蛋白 质 编码 基因 9 个 
tRNA 基因 和 2 个 rRNA 基因 ) 位 于 N 链 上 (图 1)。 

骚扰 阿 蚊 线 粒 体 基 因 组 中 的 基因 排列 紧密 ,但 
也 存在 基因 重 又 及 间隔 现象 。 其 中 ,存在 12 处 长 度 
1 ~23 bp 的 碱 基 间 隔 现 象 和 13 处 长 度 1 ~7 bp 的 
碱 基 重 至 现象 ( 表 1)。 
2.2 骚扰 阿 蚊 线 粒 体 基 因 组 碱 基 组 成 

骚扰 阿 蚊 线 粒 体 基 因 组 碱 基 组 成 见 表 2。 全 基 
因 组 的 A +T 含 量 达 到 78.8% ,明显 高 于 G+C 含 
量 (21.2% ) ,呈现 出 明显 的 AT 偏向 性 。 其 中 蛋白 
质 编码 基因 tRNA 基因 和 rRNA 基因 A +T 含 量 分 
别 为 77.7% , 80. 896 和 82. 896 。 骚 扰 阿 蚊 整个 线 
粒 体 基 因 组 不 同位 置 对 碱 基 偏 好 性 具有 一 定 的 差 
异 。 总 的 来 看 ,全 基因 组 的 AT-skew 为 正 值 (0.01 ) ， 


























2.3 ”骚扰 阿 蚊 线粒体 基因 组 蛋白 质 编码 基因 

驭 扰 阿 蚊 线 粒 体 的 蛋白 质 编 码 基 因 中 ,除了 
COI 使 用 TCG 作为 起 始 密码 子 外 , 其余 的 12 个 蛋 
白质 编码 基因 均 以 通用 密码 子 ATN 作为 起 始 密码 
子 。 驭 扰 阿 蚊 7 个 基因 (CO ATP6, COI, NDS, 
NDA , NDAL fill CYTB) VJ, ATG 作为 起 始 密 码 子 ;ND1 
以 ATA 作为 起 始 密 码 , ND2 和 47P8 2 个 基因 以 
ATC 作为 起 始 密码 子 , ND3 和 ND6 2 个 基因 以 ATT 
作为 起 始 密 码 子 。 而 在 终止 密码 子 的 使 用 上 , 除 COI 
基因 使 用 不 完全 的 T 作为 终止 密码 子 外 ,其 余 12 个 
蛋白 质 编码 基因 均 以 TAA. 作为 终止 密码 子 ( 表 1)。 

在 大 部 分 动物 线粒体 基因 组 中 , 核 背 酸 组 成 的 
差异 性 会 影响 蛋白 质 编码 基因 中 的 氨基 酸 组 成 
(Foster et al., 1997) 。 骚 扰 阿 蚊 蛋 白质 编码 基因 中 
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也 呈现 出 明显 的 氨基 酸 偏好 性 ,20 个 氨基 酸 合 量 差 

















异 明 显 , 其 中 亮 氮 酸 含量 最 高 (13. 2% ) , 谷 氨 酸 含 











量 最 低 (1. 2496 ) ( 








图 2)。 相 对 同 义 密码 子 使 用 频 


率 (RSCU) 是 评估 同 义 密码 子 使 用 频率 的 参考 值 。 
密码 子 UUA/CGA/GGA/UCU 使 用 频率 较 高 ,其 中 





UUA 最 高 ; CUG/CCG/ ACG/CAG/ AAC/UGC/ AGC/ 
AGG/GUC/GUG/GAG/GGC 使 用 频率 较 低 ,AGG 和 
GGC 最 低 (图 3)。 各 密码 子 RSCU 值 相差 较 大 , 表 
明 在 骚扰 阿 蚊 线 粒 体 基 因 组 中 密码 子 使 用 频率 具有 
明显 的 偏向 性 。 











一 





骚扰 阿 蚊 线 粒 体 基 因 组 组 成 


Table 1 Composition of Armigeres subalbatus mitochondrial genome 

















基因 位 置 (bp) 长 度 (bp) 编码 链 反 密 码 子 起 始 密码 子 ”终止 密码 子 ”基因 间 的 间隔 (bp) 
Cenes Position Length Coding strand Anticodon Start codon Stop codon Intergenic length 
tRNA™ 1 -69 69 J GAT 0 
tRNAC 67 -135 69 N TTG 3(-) 
tRNAMe 135 - 203 69 J CAT 1(-) 
ND2 204 - 1 232 1 029 J ATC TAA 0 
tRNA T? 1 234 - 1 302 69 J TCA 1(+) 
tRNA 1 302 -1 368 67 N GCA 1( -) 
tRNA™ 1 369 -1 434 66 N GTA 0 
COI 1 433 -2 974 1542 J TCG TAA 2( -) 
tRNATe™ UUR) 2 970 -3 036 67 J TAA 5(-) 
COII 3 039 -3 723 685 J ATG T 2( +) 
tRNADY 3 724 -3 794 71 J CTT 0 
tRNA ^» 3 806 -3 873 68 J GTC 11( 4) 
ATPS 3 874 -4 035 162 J ATC TAA 0 
47P6 4 029 -4 709 681 J ATG TAA 76 23) 
COIII 4 724 -5 513 789 J ATG TAA 15( +) 
tRNASY 5 513 -5 579 67 J TCC 1(-) 
ND3 5 580 -5 933 354 J ATT TAA 0 
tRNAAE 5 933 -5 996 64 J TCG o5 
tRNAAR 5 997 -6 064 68 J TGC 0 
tRNAAs 6 065 -6 131 67 J GTT 0 
tRNASer(AGN) 6 131 -6 207 77 N GCT i=) 
tRNAC™ 6 208 -6 274 67 J TTC 0 
tRNAP™ 6 273 -6 339 67 N GAA 2( -) 
NDS 6 347 -8 090 1 743 N ATG TAA 8(+) 
tRNAM' 8 084 -8 151 68 N GTG 7( -) 
ND4 8 155 -9 498 1 344 N ATG TAA 3(+) 
NDAL 9 492 -9 788 297 N ATG TAA 7(-) 
tRNAT™ 9 791 -9 855 65 J TGT 2( +) 
tRNAD 9 856 -9 921 66 N TGG 0 
ND6 9 924 — 10 446 522 J ATT TAA 2( +) 
CYTB 10 452 -11 588 1 137 J ATG TAA 5(+) 
tRNASer(UCN) 11 587 -11 652 66 J TGA 2(—) 
NDI 11 676 - 12 620 945 N ATA TAA 23( +) 
tRNA Le ( CUN) 12 627 - 12 694 68 N TAG 6( *) 
16S rRNA 12 695 — 14 028 1334 N 0 
tRNA 14 030 -14 101 72 N TAC LCE) 
12S rRNA 14 102 -14 891 790 N 








“基因 间 的 间隔 ”一 列 中 , 正 号 表示 基因 


interval base pairs between genes, while the negative sign indicates the overlapping base pairs between genes. 











间隔 碱 基 , 负 号 表示 基因 习 





EGER At. In the column of intergenic length, the positive sign indicates the 





















































118 昆虫 学 报 Acta Entomologica Sinica 61 卷 
m2 骚扰 阿 蚊 线 粒 体 基因 组 核 音 酸 组 成 
Table 2 Nucleotide composition of Armigeres subalbatus mitochondrial genome 
基因 序列 Genome sequences A% T% G% C% A +T% G +C% AT-skew GC-skew 
全 基因 组 Whole genome 39.7 39.1 8.4 12.7 78.8 21:2 0.01 -0.20 
蛋白 质 编码 基因 Protein-coding genes 32.9 44.8 10.8 11.5 qug 22.3 -0.15 -0.03 
J 链 上 的 蛋白质 编 码 基 因 
链 上 的 盘 | 1 质 编码 基因 33.6 43.0 10.1 13.3 77.6 22.4 -0.12 -0.14 
Protein-coding genes on J-strand 
第 1 位 密码 子 1st codon position 34.5 35.5 16.1 13.9 70.0 30.0 -0.01 0.07 
第 2 位 密码 子 2nd codon position 44.7 48.3 1.0 6.0 93.0 7.0 -0.04 -0.71 
第 3 位 密码 子 3rd codon position 21.6 | 45.2 12.4 20.8 66.8 33.2 -0.35 -0.25 
N 链 上 的 蛋 F 人 码 基 
链 上 的 日 质 编码 基因 32.0 47.7 13.4 6.9 79.7 20.3 -0.20 0.32 
Protein-coding genes on N-strand 
第 1 位 密码 子 1st codon position 31.7 42.9 19 6.4 74.6 25.4 -0.15 0.50 
第 2 位 密码 子 2nd codon position 20.3 50.1 16 13.6 70.4 29.6 -0.42 0.08 
第 3 位 密码 子 3rd codon position 43.9 50 0.8 5.3 93.9 6.1 -0.07 -0.74 
tRNA 基因 tRNA 40.5 40.3 11.0 8.1 80.8 19.2 0.01 0.15 
J 链 上 的 tRNA 基因 tRNA genes on J-strand 41.0 39.3 10.0 9.6 80.4 19.6 0.02 0.02 
N 链 上 的 tRNA 基因 tRNA genes on N-strand 39.8 41.6 12.4 6.1 81.5 18.5 -0.02 0.34 
rRNA 基因 rRNA 42.2 40.6 6.1 11.2 82.8 17.3 0.02 - 0.20 
16 
14 a XV ££ Double strand 
a J J-strand 
12 a N 链 N-strand 
z 
de £ 10 
e c 
miS 
ti 
EP. 
4 
2 
0 
Ala Arg Asn Asp Cys Gln Glu Gly His le Leu Lys Met Phe Pro Ser Thr Trp Tyr Val 
氨基 酸 
Amino acid 
图 2 骚扰 阿 蚊 线 粒 体 基 因 组 上 蛋白 质 编码 基因 的 氨基 酸 百分比 含量 
Fig. 2 Percentage content of each amino acid of protein-coding genes in Armigeres subalbatus mitochondrial genome 
6 
5 
su 
Z 3 
Bu 
1 
0 


Ala Arg Asn Asp Cys Cln Clu Cly His lle Leu Leu Lys Met Phe Pro Ler 


(UUR)(CUN) 
F3 E 
GCC CGC AAC GAC UGC GGC CAC AUC 
GCA CGA GGA 
CGG GGG 


GCG 


(AGN) (UCN) 
Ea 
3 ”骚扰 阿 蚊 线粒体 基因 组 相对 同 义 密码 子 使 用 频率 ( RSCU) 
Fig. 3 Relative synonymous codon usage ( RSCU) in Armigeres subalbatus mitochondrial genome 
2.4 骚扰 阿 蚊 线 粒 体 基 因 组 rRNA. 基因 及 tRNA 
基 
骚扰 阿 蚊 线粒体 基因 组 含有 2 个 rRNA 基因 ， 
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CUU [Imm Ns AGU UCU ACU MN ETE 
CUC Uuc 有 ccc uu NT Eea 
BU NECS CCA ww _UCA NOSN NIU 

AAG CCG mcum NUN MESE NUS 


Ler Thr Trp Tyr Val 


即 srRNA 和 IrRNA, Jg fe N ë E, RNA 位 于 
tRNA'^ CUP ftt tRNA fa], J& BE 1 334 bp;srRNA 在 
tRNA 和 控制 区 间 ,长 度 790 bp, AT 百 分 含 量 分 
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别 是 83.7% 和 81.3% , 低 于 总 体 水 平 。 与 所 有 的 后 生动 物 一 样 ,骚扰 阿 蚊 的 22 个 tRNA 编码 
骚扰 阿 蚊 的 22 个 tRNA 基因 大 小 在 64 ~77 bp 基因 中 只 有 tRNA 因 缺 失 DHU 辟 不 能 形成 完整 
之 间 , 总 长 度 为 1 497 bp, 在 N 链 和 J 链 上 均 有 分 布 。 ”的 三 叶 草 式 的 二 级 结构 (图 4) (Negrisolo, 2011) 。 
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4 骚扰 阿 蚊 线 粒 体 基因 组 tRNA 基因 二 级 结构 


Fig. 4 Predicted secondary structures of tRNA in Armigeres subalbatus mitochondrial genome 








120 


昆虫 学 报 Acta Entomologica Sinica 


61 卷 





2.5 库 蚊 亚 科 的 系统 发 育 关 系 

EA fi SC. E ( Anophelinae ) "P fj P3 EE NE. fi Sx 
Anopheles gambiae 为 外 群 ,使 用 已 报道 的 7 种 库 蚊 亚 
科 蚊 虫 及 本 研究 测 得 的 骚扰 阿 蚊 的 线粒体 基因 组 的 
13 个 蛋白 质 编 码 基因 核 苷 酸 序列 ,分 别 采用 最 大 似 





























然 法 (ML) 和 贝 叶 斯 法 (BI) 构建 库 蚊 亚 科 昆虫 的 系 
统 发 育 树 。 结 果 显 示 两 种 建树 方法 得 到 的 拓扑 结构 


一 致 , 均 将 库 蚊 亚 科 分 为 2 X, — 5c 818 PU RJ 
属 Culex (boostrap 值 100% ) , 另 一 支 包 括 了 伊 蚊 属 
Aedes 和 阿 蚊 属 Armigeres ( boostrap 值 90% ) 。 在 两 
个 系统 发 育 树 中 ,骚扰 阿 蚊 均 聚集 在 伊 蚊 属 Aedes 
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图 5 基于 
















F 线粒体 基因 组 的 13 个 蛋白 质 编码 基因 核 背 酸 序列 的 库 蚊 


Zo mGROECE BOE 


分 支 系 ,与 伊 蚊 属 Aedes 组 成 姐妹 关系 , 且 置 信 值 均 
大 于 80%。 在 本 研究 中 ,骚扰 阿 蚊 与 库 蚊 属 Culex 
蚊虫 的 遗传 距离 为 0.08 (0.03 + 0. 05 ) ,远大 于 骚 
扰 阿 蚊 与 伊 蚊 属 Aedes 的 遗传 距离 (0. 00) ,表明 驿 
扰 阿 蚊 和 伊 蚊 属 Aedes. 蚊虫 有 更 近 的 亲缘 关系 , 特 
别 是 与 伊 蚊 属 Aedes 中 的 纷 蚊 亚 属 Finlaya 关系 最 
近 。3 个 属 之 间 的 系统 发 生 关系 为 库 蚊 属 Culex + 
( 阿 蚊 属 Armigeres + 伊 蚊 属 Aedes) ,各 属 内 亚 属 均 聚 
为 一 支 , 且 置 信 值 较 高 ,系统 发 育 关 系 可 信和 度 较 高 。 
这 与 现 沿用 的 形态 分 类 学 结果 相 一 致 ,很 好 地 支持 
了 Harbach 对 蚊 科 的 最 新 分 类 系统 (Harbach, 2007) 。 
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严 科 系 统 发 育 树 (最 大 似 然 法 和 贝 叶 斯 法 ) 








Fig. 5 Phylogenetic tree of Culicinae based on the nucleotides of 13 protein-coding genes of mitochondrial genomes 


( maximum likelihood method and Bayesian interference ) 














进化 枝 上 方 为 置信 值 , 下 方 为 遗传 距离 ;红色 和 蓝 色 数 值 分 别 代表 最 大 似 然 法 和 贝 叶 斯 法 所 计算 的 结果 。The values on top 


and bottom of the branches represent the confidence values and genetic distance, respectively. Red and blue values stand for the results 


of the maximum likelihood estimation and Bayesian algorithm, respectively. 


fi ( Harbach, 2017) ,已 公开 发 表 50 种 ( 亚 种 ) 蚊虫 
线粒体 基因 组 数据 ,线粒体 基因 组 数据 仍 远 远 不 足 ， 
后 续 需 要 进一步 对 蚊 科 其 他 种 属 的 线粒体 基因 组 测 





线粒体 基因 作为 重要 的 母性 遗传 标记 被 广泛 应 
用 于 分 子 进 化 分 析 、 种 群 遗传 结构 分 析 .系统 发 生 学 
分 析 等 方面 。 本 研究 首次 测 得 阿 蚊 属 蚊虫 的 线粒体 
全 基因 组 序列 ,并 对 其 线粒体 基因 组 进行 了 注释 和 
分 析 , 丰 富 了 蚊 科 线粒体 基因 组 的 数据 信息 ,为 研究 
蚊 科 的 分 子 系统 发 育 进 化 关系 提供 了 数据 基础 , 特 
别 是 为 研究 阿 蚊 属 在 库 蚊 亚 科 中 的 系统 发 育 位 置 黄 
定 了 基础 ;其 次 ,骚扰 阿 疏 线粒体 基因 组 的 结构 特点 
和 碱 基 组 成 分 析 对 库 蚊 亚 科 线粒体 基因 组 水 平 的 比 
较 分 析 提 供 了 基础 数据 ;最 后 ,基于 骚扰 阿 疏 和 9 条 
已 知 蚊虫 的 线粒体 基因 组 中 13 个 蛋白 质 编码 基因 
序列 构建 了 库 蚊 亚 科 的 系统 发 育 关 系 , 为 阿 蚊 属 在 
库 蚊 亚 科 中 的 分 类 地 位 提供 了 分 子 依据 ,也 为 后 续 
构建 蚊 科 系 统 发 育 关系 提供 了 分 子 数据 。 
到 目前 为 止 , 蚊 科 共 包 含 2 亚 科 ,112 属 ,3 557 

















序 分 析 ,丰富 蚊 科 线粒体 基因 组 数据 ,从 而 构建 蚊 科 
各 亚 科 、 属 及 亚 属 间 的 系统 发 生 关系 。 
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